Wyodrębnij tekst

Podczas wyodrębniania dużej ilości tekstu z dokumentów proces może być nieefektywny i czasochłonny, zwłaszcza przy pracy z tabelami i dużymi ilościami akapitów. Jednak metoda ExtractText od IronWord to rozwiązanie oszczędzające czas. Umożliwia programistom łatwe wyodrębnienie całej określonej ilości tekstu w dokumencie, eliminując potrzebę dodatkowych pętli i upraszczając dostęp do właściwości Text. Ta metoda gwarantuje, że programiści mogą pracować wydajnie i oszczędzać cenny czas.

W tym przykładzie przedstawimy kilka sposobów użycia metody ExtractText i zwiększenia wydajności przy pobieraniu tekstu z dokumentów.

Przydatne sposoby na wyciąganie tekstu z pliku Docx

  • using IronWord;
  • WordDocument doc = new WordDocument("multi-paragraph.docx");
  • Console.WriteLine(doc.ExtractText());
  • Console.WriteLine(doc.Paragraphs[0].ExtractText());
  • Console.WriteLine(doc.Paragraphs.Last().ExtractText());

Wyodrębnij tekst

Dzięki bibliotece IronWord wyodrębnianie tekstu z dokumentu Worda jest prostym procesem. Zaczynamy od importowania biblioteki i inicjalizacji klasy WordDocument. Ten krok pozwala nam wczytać istniejący dokument z akapitami. Następnie wywołujemy metodę ExtractText i wypisujemy cały tekst dokumentu do konsoli.

Wyodrębnij określony tekst

W powyższym przykładzie wyodrębniono cały tekst dokumentu, ale dzięki bibliotece IronWord masz pełną kontrolę nad procesem wyodrębniania. Jeśli chcesz tylko określone fragmenty lub akapity, możesz użyć właściwości Paragraphs w WordDocument, aby zwrócić tablicę Paragraphs. Jako ogólna lista, tę tablicę można manipulować według potrzeb, albo wywołując indeks, jak pokazano powyżej z doc.Paragraphs[0], albo używając wbudowanych metod tablicowych dla kolekcji C#.

Przy dostępie do indeksu Paragraphs, zwracamy i wyodrębniamy tekst tylko z pierwszego akapitu dokumentu i wypisujemy go do konsoli. Następnie, wywołujemy także Last na tablicy Paragraphs, aby zwrócić i wyodrębnić tekst tylko z ostatniego akapitu dokumentu.

Poznaj API IronWord do zaawansowanego wyodrębniania tekstu

Gotowy, aby rozpocząć?
Nuget Pliki do pobrania 38,043 | Wersja: 2026.4 just released
Still Scrolling Icon

Wciąż przewijasz?

Czy chcesz szybko dowodu? PM > Install-Package IronWord
uruchom próbkę zobacz, jak twoje dane stają się dokumentem Word.